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Многопроцессорная система реализации 
бинаурального слуха с массивом микрофонов 


В статье предлагается вариант практической реализации системы бинаурального слуха, присущего человеку 
и многим представителям животного мира. Свойства бинаурального слуха реализуются путем операций 
над образами акустических сигналов, получаемых с массива микрофонов. Реализация предполагает связную, 
синхронизированную работу 3 микропроцессоров, выполняющих чтение сигналов с 4 микрофонов через два 
16-разрядных АЦП с частотой дискретизации 100 кГц по каждому каналу с синхронизацией между 
каналами с точностью 5 мкС. В реализацию включена ЕГАЗН карта емкостью 2 ОВ и микропроцессор, 
реализующий интерфейс ОЗВ с персональной ЭВМ. Реализация предусматривает как автономную работу 
системы, так и совместно с персональной ЭВМ. Система имеет свойства, не присущие слуху человека, — 
нулевое время адаптации при переходе от сильного сигнала к слабому и наоборот, локализацию очень 
коротких сигналов. 


Введение 


Под бинауральным слухом понимается система восприятия и анализа звуковых 
сигналов окружающей среды, подобная той, которой обладают люди и ряд животных. 
Принято считать, что система бинаурального слуха состоит из двух сенсоров (ушей) 
и системы обработки информации (головной мозг). Данная конфигурация системы 
позволяет человеку и животным ориентироваться в окружающем мире, общаться 
между собой, развиваться за счет обучения и самообучения. 

Целью работы является разработать автономную систему бинаурального слуха 
и реализовать ее в виде отдельного устройства для применения в робототехнических 
системах и других областях искусственного интеллекта. 

Более конкретно рассмотрим робототехническую систему (РТС), оснащенную 
сенсорами различной физической природы и смонтированную на подвижной плат- 
форме, позволяющей проникать в труднодоступные места [1]. Одной из задач РТС 
является проведение разведки в местах природных и техногенных катастроф с целью 
обнаружения живых людей, подающих какие-либо признаки жизни. В частности для 
этой цели используются микрофоны звукового диапазона (300 — 5000 Гц). Работая с 
сигналами звукового диапазона, можно решить следующие задачи: определить число 
источников, определить направления на источники (локация источников), определить 
природу источника (живой или неживой природы). Имеется множество моделей рас- 
пространения звука и множество практических реализаций систем локации звука. 

В частности, известная трехмерная модель распространения звуковой волны в 
однородной воздушной среде, находящейся в состоянии покоя и не имеющей резо- 
наторов и ревербераторов, для одного неподвижного источника, создающего звуковое 
давление р, и скоростей распространения волны и, у и у? по координатам х, у, 2 с 
плотностью воздуха р, и эластичность воздуха К имеет вид: 


Чи ар 
—+--=0; 1 
во —. 
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При этом явно предполагается, что источник и приемник(и) имеют вид точки. 
Известна [2] и модель пеленгации источника с помощью двух сенсоров, кото- 
рую геометрически можно интерпретировать схемой как на рис. 1. 


У 


Е1 


Рисунок 1 — Геометрическая схема модели пеленгации источника 


Решение задачи пеленгации сводится к определению расстояний между источ- 
ником и сенсорами (микрофонами), что эквивалентно измерению разности фаз сигналов 
на выходе сенсоров для каждого из источников. Общая задача разделяется на ряд 
подзадач, а именно — разделение сигналов по частотным полосам, определение при- 
надлежности сигналов источникам, фазовые измерения [3], [4]. 

Для задач обработки сигналов звукового традиционно применяются прямое и 
обратное преобразования Фурье, которые требуют больших вычислительных ресурсов. 
Автором предложен [5] другой метод представления сигналов, который значительно 
понижает требования к вычислительным ресурсам и позволяет решить задачи обработки 
на обычных микропроцессорах. На основе имеющихся знаний и строится многопро- 
цессорная система реализации бинаурального слуха с массивом микрофонов. 


1. Пеленгация источника 


Обращаясь к схеме на рис. 1, можно видеть, что если расстояние х/2 между сен- 
сорами Е и Е2 фиксировано, то для всех частот звукового диапазона / можно вычислить 
разность фаз: 

Дф = (Ф1 — 62) = Ез{ х!2,/,( хьь у}. (5) 
Разумеется, пару координат (х/, у) можно представить как функцию разницы рас- 
стояний от источника 5 до сенсоров Р/, Е2 или как угол между источником и осью — 
Х, Х. Из этой модели сразу видна неоднозначность решений — при одном и том же 
значении частоты имеется минимум 4 варианта правильных решений, каждый из 
которых лежит в одной из четвертей декартовых координат. Более того, если частота 
сигнала такова, что ее полупериод несколько раз укладывается в промежуток х/12, то 
число решений следует умножить на число поворотов фазы сигнала в промежугке х/2. 

Из этой модели следует, что для правильного построения образа звука для 
каждого из источников необходимо иметь минимум четыре сенсора давления, раз- 
несенных в пространстве. Из четырех сенсоров Ро, Ех, Е’, Ё. образуют пары - (Ри + Ё,), 
(Ро+ Е), (Ро ЗЕ Е.) (рис. 2). 
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Каждую пару сенсоров можно рассматривать как стереопару и построить три 
потока полупериодных образов сигнала относительно центрального сенсора. Далее, 
используя операции над полупериодами и анализируя фазовые различия сигналов в 
каждом из трех образовавшихся потоков данных, можно восстановить неискаженный 
образ исходного сигнала по каждому из заданных направлений или по каждой из ус- 
тойчивых фаз. 


Рисунок 2 — Модель размещения сенсоров в объеме 


Из этой модели также следует, что для восстановления образа звука в одной 
плоскости достаточно трех сенсоров, но достоверность образа будет снижена. 

Имеется частный случай, позволяющий восстановить образ звука с помощью 
двух сенсоров — когда источник звука лежит точно на биссектрисе угла в одной из 
координатных плоскостей - например, на биссектрисе угла У, 0, Х -— рис. 2. При этом 
расстояние от источника 55 до сенсоров Ех, Ку является одинаковым и, следовательно, 
фазовая задержка сигналов тоже является одинаковой. 

В общем случае работа предлагаемого метода для пары сенсоров (Ро, Е,) сос- 
тоит в том, что сигнал с сенсора Ро представлен последовательностью полупериодов 
Ро, а сигнал с сенсора Рх представлен последовательностью полупериодов Р.. В свою 
очередь, источник звука 5, генерирует последовательность полупериодов Р», а источ- 
ник шума 5„ генерирует последовательность полупериодов Р,. В воздушной среде 
происходит сложение последовательностей полупериодов такое, что Ру = Р; + Р,, Р.= 
=Р;-+ Ри РР. 

Задача состоит в том, чтобы по имеющимся Ру и Р. восстановить Р;и Р, и опре- 
делить направления на источники 5., 5„. Задача представления сигналов в виде полу- 
периодов решается применением только целочисленной арифметики, без применения 
Фурье -— анализа. Собственно данные о сигналах представлены в виде целых чисел и 
для операций над сигналами достаточно целочисленной арифметики, которая встроена 
на аппаратном уровне в большинство современных микропроцессоров. 

Таким образом, решение задачи пеленгации источников сводится к решению 
задач разделения сигналов по полосам для каждого из сенсоров, вычислению фазового 
сдвига по полосам сигналов для всех возможных пар сенсоров (6 пар для данного случая). 
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На рис. 3 показана типовая система обработки звукового сигнала с пары сен- 
соров. Символами ЕЕТ обозначен блок прямого преобразования Фурье, ГЕЕТ — обратного 
преобразования Фурье, РО - разделение сигналов по фазам. Для К пар сенсоров 
необходимо иметь К механизмов сравнения. Соответственно каждый механизм срав- 
нения потребует отдельного микропроцессора, имеющего встроенные преобразования 
Фурье. В принципе такие микропроцессоры есть (например фирмы Техаз штате, 
США), но построение системы, содержащей 6 подобных микропроцессоров, представ- 
ляется весьма проблематичной задачей. Даже будучи построенной, такая система никак 
не будет удовлетворять требованиям, предъявляемым к портативным системам по 
габаритам, энергопотреблению и стоимости. 
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Рисунок 3 — Типовая система обработки сигналов с двух сенсоров 


Учитывая специфику работы малогабаритного робота, энергетические и стоимост- 
ные показатели, можно сделать вывод о необходимости разработки системы бинау- 
рального слуха, основанную на более простых принципах работы и более простых 
микропроцессорах. 


2. Структура системы 


При построении системы следует учитывать следующие требования: 
— система должна воспринимать звуковые сигналы с расстояния 0,5..5 м с уровнем, 
достаточным для работы АЦП; 
— система должна обладать минимальной инерцией при восприятии сигналов. 
Реализация первого требования выполняется применением усилителей с малым 
уровнем собственных шумов. Реализация второго требования необходима для восприя- 
тия слабых сигналов, следующих после сильных сигналов. Известно, что человеческий 
слух требует некоторого времени на адаптацию для восприятия слабого сигнала после 
гораздо более мощного сигнала. Применение системы усилителей с автоматической 
регулировкой усиления (АРУ) в общем решает задачу, но порождает новую проблему — 
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выбора времени реакции системы. Кроме того, начало сильного сигнала, следующего 
после слабого, будет неправильно восприниматься до тех пор, пока система АРУ не 
уменьшит коэффициент усиления. Это грозит потерей сигнала вообще, так как ко- 
роткий сигнал за время настройки АРУ может просто прекратиться. Например, если 
рядом с микрофоном с некоторым интервалом падают капли воды (мощный сигнал), 
то проблематично воспринять слабый сигнал с расстояния 5 м. В качестве системы, 
не имеющей инерции, можно предложить многоканальную систему, в каждом из 
каналов устанавливается свой, фиксированный коэффициент усиления и результаты 
оцифровки каждого канала записываются в отдельный файл данных. На рис. 4 пока- 
зана структурная схема подобной системы. 
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Рисунок 4 — Структурная схема устройства с 4 сенсорами 


Собственно микрофоны Ру, К», Ё,, Е. представляют собой электретные микро- 
фоны от мобильных телефонов, выходы которых подключены ко входам аналогового 
мультиплексора (коммутатора). К выходам микрофонов подключены входы аналоговых 
усилителей с постоянным коэффициентом усиления, выходы которых также подключены 
ко входам аналогового мультиплексора. Выходы аналогового мультиплексора под- 
ключены ко входам АЦП микроконтроллера. Собственно два 16-битовых АЦП с 
частотой дискретизации 1 мГц входят в микроконтроллер № 1 типа С8051Е060 (фир- 
ма ЗПафз, США). Данный микроконтроллер обладает производительностью 24 МПР$ 
(миллионов целых операций в секунду) и достаточным количеством линий ввода — 
вывода, чтобы управлять переключением входов АЦП и выводить полученные данные 
в память типа Сотрасе ННазВ емкостью 2 СВ. Данные с АЦП вводятся с фиксирован- 
ным интервалом равным 5 мкС. Высокая точность АЦП (16 разрядов) и высокая 
частота дискретизации (до 100 кГц на канал) позволяют сохранить образ сигнала с 
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минимальными частотными и фазовыми искажениями. Напомним, что входной 
сигнал имеет диапазон 300 — 5000 Гц, что в 300 - 20 раз менее частоты дискретизации. 
Можно говорить, что частотные и фазовые искажения, вносимые каналами устройства, 
не превышают 5 % для любого сигнала в диапазоне 300 — 5000 Гц. Быстродействия 
микроконтроллера и памяти достаточно, чтобы получить и сохранить данные без 
потерь, но недостаточно для обработки полученных данных. 

Для обработки данных используется микроконтроллер № 2 типа С8051Е120 
(фирма ЗПаБз, США). Данный микроконтроллер обладает производительностью 100 
МР. В задачи этого микроконтроллера входит чтение полученной информации из 
памяти, обработка этой информации, сохранения результатов обработки в этой же 
памяти и выдача информации по внешним запросам. Задание режима работы МК № 2 
и устройства в целом может производиться как через ОЗВ интерфейс, так и с мест- 
ного пульта (не показан ввиду его тривиальности). 

ОЗВ интерфейс реализован на микроконтроллере № 3 типа С8051Е342 (фирма 
ЗПаЬз$, США). Данный микроконтроллер обладает производительностью 48 МГР$. 
В задачи этого микроконтроллера входит чтение полученной информации из буферной 
памяти МК № 2, передача ее в НОЗТ машину, получение управляющих команд из 
НОЗТ машины и дальнейшая передача управляющей информации МК № | и МК № 2. 


Выводы 


Предлагаемая многопроцессорная система реализации бинаурального слуха с 
массивом микрофонов позволяет принципиально реализовать все свойства, присущие 
слуху человека, — восприятие звуков в широком диапазоне частот и амплитуд, лока- 
лизацию источников звуков по направлениям, определение подвижности источников. 
Разумеется, эти свойства реализуются только в ближнем окружении - на расстоянии 
не более 5 м. 

Предлагаемая система обладает рядом свойств, которые не присущи слуху че- 
ловека: 

— благодаря записи всех сигналов в память, система может анализировать и корот- 
кие сигналы, например, типа выстрел; 

— система имеет время адаптации к сигналу = 0, что позволяет воспринимать без 
искажений как слабые после сильных, так и сильные после слабых сигналов; 

— после разделения сигналов по направлениям и источникам, система может синте- 
зировать сигнал как суммарный от двух и более выбранных источников (например, 
для выделения общей шумовой картины); 

— система может быть быстро обучена поиску определенных сигналов благодаря нали- 
чию ОЗВ интерфейса. В систему могут быть очень быстро переданы образы сигналов, 
которые следует обнаруживать или наоборот, игнорировать — то есть обучение системы 
не требует звукового воспроизведения фильтруемых сигналов. 

Применение предлагаемой системы на борту малогабаритного робота позволяет 
реализовать задачи поиска и локализации источников звуковых сигналов в любых 
ситуациях и окружающих условиях. Применение предлагаемой системы в автономном 
варианте позволяет решить вопрос восприятия и разделения по источникам множества 
голосов, например, во время совещания, дискуссии. Предлагаемая система может 
служить для распознавания голоса при диалоге двух людей -— с ее помощью решается 
задача получения качественного сигнала без применения микротелефонных гарнитур и 
в широком диапазоне расстояний между говорящими. Предлагаемая система может 
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служить для распознавания голоса в системах голосового управления оборудованием в 
промышленности (в т.ч. управления роботами), быту — управляющий голос восприни- 
мается со значительного расстояния без применения носимого микрофона. Предлагаемая 
система может служить как узконаправленный микрофон, то есть воспринимать сигнал 
только с заданного направления. 
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С.О. Полвцев 

Багатопроцесорна система реалзацй б1наурального слуху 13 масивом мкрофонв 

У статт! пропонуеться вартант практично! реалзаци системи б1наурального слуху, властивого людин! 
та багатьом представникам тваринного свту. Властивост! б1наурального слуху реаллзуються шляхом 
операщй над образами акустичних сигналв, як! надходять 13 масиву ммкрофовв. Реал!защя передбачае 
зв’язну, синхронзовану роботу 3 м!кропроцесор1в, що виконують читання сигнал1в з 4 мкрофонв 
через два 16-розрядних АЦП 13 частотою дискретизаци 100кГц по кожному каналу 13 синхронзащею 
миж каналами з точнистю 5 мкС. У реалзащю включена НИазН карта мсткстю 2 ОВ та мжропроцесор, 
що реалвзуе 1нтерфейс ОЗВ 1з персонально: ЕОМ. Реализащя передбачае як автономну роботу системи, 
так 1 сумено з персональною ЕОМ. Система мае властивост!, як! не властив1 слуху людини, — 
нульовий час адаптаций при переход! в1д сильного сигналу до слабкого та навпаки, локал1защю дуже 
коротких сигналив. 


5.А. РоП5еу 

Мш@ргосе$$0г5 Зузет оЁГ Веа|!7аНоп Вшаига! Неагто ууНВ а Аггау оЁЕ Уйсгорвопе$ 

Шш аги‹е фе уапапе оё ргасИса| геайтайоп оЁ зу%ет Бпапга| Веагте шБегепе 15 оНеге4 1ю Ше регзоп апа 
тапу гергезетайуез оЁ ипа. Ргорегйез Ытапга| Веагте аге геа7е4 Бу ореганоп$ абоуе ппазез оЁ 1е 
асоизИс 5121а[5 гесегуе4 Нот а аггау оЁ пл1сгорКопез. КеаПхайоп аззитез пе сопегепф, зупсбгоп7е4 \могК 
о# 3 писгоргосеззог$ УЙисеВ аге саггуте оиё геа@ те оЁ $12па!$ Нот 4 пусгорБопез @тгочев мо 16 @2й 
АРС ум #Недиепсу оЁ Че1таноп 100 КН оп еасв сваппе| у зупсЬгоп1тайоп Бебмееп сБаппе!$ \ИВ 
ассигасу 5 и$. ш геаНтеЯ фе Раз саг ш сарасйу 2 СВ ап@ Фе пусгоргосеззог геап7ште пмегасе О$В 
Кот Фе регзопа! СОМРОТЕЕК 1$ шс[аде4. КеаПтаНоп ргоу!ез шдереп4еп{ \огК о# зузет ап4 {осейег 
УЛ Фе регзопа! СОМРОТЕК. ТБе зузет Баз ргорегиез поё шБегепё ш Беагте оЁ Те регзоп — 7его Чите 
огадарайоп а тапуоп Вот а 5гоп$ 512па1 1ю ууеаК ап@ оп Фе сопёгагу, 1осайтайоп оЁуегу Вог 12та[5. 


Статья поступила в редакцию 08.12.2008. 
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